【GEO Database |
您所在的位置:网站首页 › geo net › 【GEO Database |
文章目录
一、从GEO查询GSE65496,并下载GSE65496_family.soft和原始数据(.cel格式)二、仔细研读soft格式文件三、用Bionconductor下的affy包下函数处理.cel文件,得到探针表达值1.用Bioconductor中的相应包对表达谱数据做质量分析1)灰度图2)RNA降解分析
2.对芯片数据做如下分析1)Mas5或rma方法进行背景校正,标准化(归一化)2)提取表达值
四、下载该数据对应的平台数据,通过文本处理,将探针和gene symbol对应,得到gene symbol的表达值
背景介绍:Affymetrix的探针(probe)一般是长为25碱基的寡聚核苷酸;探针总是以perfect match 和mismatch成对出现,其信号值称为PM和MM,成对的perfect match 和mismatch有一个共同的affyID。
CEL文件:信号值和定位信息。 CDF文件:探针对在芯片上的定位信息 affy包是R语言的bioconductor系列包的一个,就一个功能,读取affymetix的基因表达芯片数据-CEL格式数据,处理成表达矩阵!!!(转) 一、从GEO查询GSE65496,并下载GSE65496_family.soft和原始数据(.cel格式)我直接进入NCBI官网->GEO Database -> 搜索GSE65496后下拉至页面底部进行下载 但是 不推荐!!! 建议直接安装GEOquery包进行下载 if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager") BiocManager::install("GEOquery") library("GEOquery") getGEOSuppFiles("GSE65496") ##解压 untar("GSE46106_RAW.tar") 二、仔细研读soft格式文件#是对平台的描述 数据从ID那一行开始 首先,安装affy包,读取.cel文件 if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager") BiocManager::install(version = "3.12") BiocManager::install("affy") BiocManager::install("limma") library("Biobase") library("affy") library("limma")读取下载好的数据 setwd("C:/Users/Administrator/Desktop") data.raw |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |